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Globalizarea, evoluțiile economice tot mai dificil de anticipat, acțiunile 
neaşteptate ale concurenţilor, schimbarea preferințelor consumatorilor, evoluţiile 
tehnologice tot mai accentuate pun managerii în situaţii din ce în ce mai dificile în 
privinţa adoptării unor decizii corecte, care să conducă organizațiile pe un drum optim. 
Perioada empirismului în management a trecut de mult timp, însă chiar şi tehnicile şi 
metodele clasice de analiză a mediului de afaceri încep să nu mai dea rezultatele scontate. 
Una dintre cauzele determinante o constituie cantitatea uriaşă de date cu care trebuie să se 
confrunte managerii de la diferite niveluri şi care devine sufocantă, nepermiţând 
decidenților să vadă esențialul problemei apărute. 

Bazele de date tradiționale, în marea lor majoritate relaționale, permit sprijinirea 
procesului de luare a deciziilor într-o anumită măsură, mai ales în privința problemelor de 
tip cantitativ: Care este media încasărilor lunare? Care este primul client? 

Însă economia concurenţială actuală obligă managerii să rezolve mai ales 
probleme de tip calitativ: De ce o parte a clienţilor preferă un anumit produs, iar ceilalți 
nu? De ce într-o anumită regiune campaniile promoționale nu dau rezultate? Sistemele 
de prelucrare a tranzacţiilor nu au fost proiectate pentru a înlesni rezolvarea acestui tip de 
probleme, şi ca urmare nu pot furniza în timp util un răspuns corect managerilor. 
Decidentul este nevoit să piardă timp pentru a deriva informaţia de care are nevoie din 
sistemul de rapoarte pe care îl are la dispoziţie, iar cei din departamentul IT sunt nevoiți 
să obțină rapoarte ad-hoc din sistemele operaționale de procesare a tranzacţiilor. De cele 
mai multe ori datele solicitate pentru raportul respectiv sunt “împrăştiate” în mai multe 
sisteme operaţionale, ceea ce implică în prealabil integrarea lor. Întârzierile nu sunt doar 
consumatoare de timp, dar pot afecta serios activitatea organizaţiei; când raportul este în 


sfârşit obținut, este posibil ca datele să fie inconsistente sau incorecte. 
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Între activităţile operaţionale şi activităţile de luare a deciziilor la nivel strategic 


e tai s ; E 1 
există o serie de diferențe majore : 


Activităţi (decizii) la nivel operațional Activităţi (decizii) la nivel strategic 
Frecvenţă mare Frecvenţă redusă 

Previzibile Imprevizibile 

Volum redus de date interogate Volum mare de date interogate 

Necesită îndeosebi date curente Necesită date trecute, prezente şi previziuni 
Puţine derivări complexe Multe derivări complexe 


Tabel nr. 1 — Operaţional vs. strategic 

Sistemele informaţionale de asistare a deciziilor vor trebui să facă faţă unor 

cerinţe şi constrângeri din ce în ce mai numeroase din partea celor care le utilizează: 

e Cantități mari de date — volume de ordinul sutelor de Gigabytes; 

e Multe niveluri de detaliere — de la clase de produse la mărci, linii de produse, grupe 
de produse şi produse individuale; 

e Mulți factori şi multe criterii de analiză — produse, localizări geografice, piață, 
perioade de timp; 

e Mai mulți utilizatori ale aceloraşi date — sute sau mii; 

e Decizii luate la diferite niveluri. 

Organizațiile încearcă să răspundă acestor provocări prin mijloace diverse, în 
funcție de cultura pe care o au şi de resursele disponibile. Un curent la modă şi care se 
pare că va fi unul de succes în viitor este cel al depozitelor de date bazat pe conceptul de 
date multidimensionale. 

În anul 1992, William H. Inmon defineşte în cartea sa “Building the Data 
Warehouse” termenul de depozit de date ca fiind o colecție de baze de date integrate, 
orientate subiect, proiectate în scopul asigurării informaţiilor necesare în procesul de 
luare a deciziilor (“a collection of integrated, subject-oriented databases designed to 


supply the information required for decision-making”). 


' Thomsen, E., “OLAP Solutions. Building multidimensional information systems”, Wiley Computer 
Publishing, SUA, 2000, p.9. 

i Humphries, M., Hawkins, M., Dy, M., “Datawarehousing. Architecture and implementation”, Pretince 
Hall PTR, 1999, p.34). 
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În strânsă legătură cu depozitele de date s-a cristalizat modelarea 
multidimensională a datelor. 

Sistemele de procesare a tranzacţiilor (OLTP — Online Transactional Processing) 
folosesc de obicei standardul relaţional, care se bazează în primul rând pe normalizare. 
Structurile normalizate permit sistemelor operaționale să înregistreze şi să stocheze sute 
de mii de înregistrări, tranzacții individuale, fără a exista riscul pierderii sau alterârii 
datelor. Deşi bazele de date normalizate sunt eficiente pentru sistemele OLTP, ele 
provoacă probleme atunci când sunt utilizate în sistemele decizionale. 

Pentru a crea chiar cele mai simple rapoarte dintr-o structură normalizată sunt 
necesare cunoştinţe de SQL; decidenții de la nivelurile superioare nu au timp şi nici nu 
trebuie să fie nevoiţi să cunoască structura bazei de date sau limbaje de interogare 
sofisticate. 

Să presupunem exemplul din figura nr. 1. Dacă un manager are nevoie de un 
raport cu vânzările de produse pe fiecare cumpărător în parte (fig. nr.2), programul de 
interogare trebuie să acceseze tabelele Clienti, Conturi, Tip cont, Ordine, Linii ordine, 
Produse pentru a calcula totalurile dorite. Clauza WHERE din fraza SQL va fi destul de 


simplă, dar foarte lungă; înregistrările din diferite tabele trebuie să fie relaționate pentru a 


furniza rezultatul corect. 


/N 
V 


Figura nr. 1 — Exemplu de structură normalizată 
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Vânzările de produse pe clienţi 


Data: 28 sepetembrie 2001 


Client Denumire produs Valoare vânzări 

Client A Produs X 3.400 
Produs Y 7.600 

Client B Produs X 2.000 


Figura nr.2 — Raportul vânzărilor de produse pe clienți 
Una din metodele folosite pentru a înlesni munca de obținere a datelor o 
constituie modelare dimensională, care oferă tehnici de denormalizare a structurii bazei 
de date pentru a crea scheme care sunt convenabile pentru sprijinirea procesului 
decizional. 
În modelarea dimensională sunt folosite două tipuri de tabele: tabele de fapte şi 


tabele de câutare (tabele dimensionale). 


Tabele de fapte 
Tabelele de fapte sunt folosite pentru a înregistra faptele reale ale afacerii. Faptele 


sunt date numerice care sunt de interes pentru afacerea respectivă. 
Exemple de tabele de fapte pentru diferite domenii de afaceri: 
e Comerț cu amănuntul: numărul de unități vândute, valoarea vânzărilor 
e Telecomunicaţii: durata convorbirilor în minute, numârul mediu de apeluri 
e  Bânci: valoarea tranzacţiilor, numărul mediu de tranzacții 
e Asigurări: valoarea despăgubirilor 
e Transport aerian: preţul biletelor, greutatea bagajelor 
Faptele sunt valori numerice pe care utilizatorii le analizează şi le sintetizează 


pentru a înțelege mai bine diverse aspecte ale afacerii. 


Tabele de căutare (dimensionale) 
Tabelele de căutare au rolul de a stabili contextul faptelor; ele conţin câmpuri care 


descriu faptele. 
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Exemple de tabele de căutare pentru aceleaşi domenii de afaceri: 
e Comerţ cu amănuntul: denumirea magazinului, codul poştal al magazinului, 
denumirea produsului, categoria produsului, ziua săptămânii 
e Telecomunicaţii: originea apelului, destinaţia apelului 
e Bănci: numele clientului, numărul contului, data, domeniul de activitate al clientului, 
numele administratorului de cont 
e Asigurări: tipul poliţei de asigurare, bunurile asigurate 
e  Tranpsort aerian: numărul zborului, destinația zborului, clasa de călătorie. 
Când un manager cere un raport care să prezinte încasările pentru magazinul X, în 
luna Y, pentru produsul Z, el foloseşte dimensiunile Magazin, Timp şi Produs pentru a 
descrie contextul încasărilor (faptele). 
Vizual, o schemă multidimensională are o arhitectură de tip stea, în care tabelele 
de fapte se află în centru, iar tabelele de câutare sunt dispuse în jurul lor. În figura nr.3, 
dimensiunile sunt Client, Timp, Produs şi Magazin. Câmpurile din aceste tabele sunt 


folosite pentru a descrie faptele din tabela de fapte Vânzări. 


VANZĂRI 
Tabela de fapte 


Figura nr.3 — Exemplu de arhitectură tip stea 


Unul dintre principiile cheie ale modelării multidimensionale este folosirea 
tabelelor de fapte în formă normalizată împreună cu tabelele de căutare în formă 
denormalizată. În exemplul din figura nr.3, datorită faptului că tabelele de căutare sunt 
denormalizate, schema nu mai cuprinde şi alte tabele dincolo de cele patru. În constrast, o 


dimensiune Produs pe deplin normalizată are tabelele adiționale din figura nr.4. 


Grupa <1 Subgrupa <1 Categorie <1 Produs 
II = = 
produs produs produs 


Figura nr. 4 — Tabele Produs normalizate 
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Tabelele normalizate sunt cauza dificultății cu care un utilizator navighează prin 
ele pentru a găsi informaţiile de care are nevoie. Prin denormalizarea dimensiunilor, 


printr-o singură tabelă utilizatorul găseşte informațiile dorite. 


Ca rezultat al denormalizării dimensiunilor, fiecare dimensiune va conţine 
ierarhii care implică gruparea şi structurarea. Cel mai simplu exemplu se regăseşte în 
dimensiunea Timp. După cum se arată în figura nr. 5, dimensiunea Timp are o ierarhie 
Zi-Lună-Trimestru-An. Similar, dimensiunea Magazin poate avea ierahia Oraş-Judeţ- 
Regiune-Total magazine. Dimensiunea Produs poate avea o ierarhie Produs-Categorie 


produs-Grupă produs-Total Produse. 


Timp Magazin Produs 
An Total magazine Total produse 
Trimestru Regiune Grupă produs 
Lună Judeţ Categorie produs 
Zi Oraş Produs 


Figura nr. 5 — Ierarhii dimensionale 
Când utilizatorii depozitului de date navighează prin el pentru a afla informații cu 
diferite niveluri de detaliere, ei de fapt se poziţionează la un anumit nivel din fiecare 
ierarhie. De exemplu, un utilizator poate să dorească inițial un raport al vânzărilor cu 
totalul vânzărilor pentru fiecare regiune în fiecare an. Pentru un astfel de raport, 
utilizatorul se poziţionează la nivelul 1 al ierahiei Timp, la nivelul 2 al ierarhiei Magazin 


şi la nivelul 1 al ierarhiei Produs (vezi fig. nr. 6). 


Timp Magazin Produs 
An Total magazine Total produse 
Trimestru Regiune Grupă produs 
Lună Judeţ Categorie produs 
Zi Oraş Produs 


Figura nr. 6 — Interogare prin poziţionare în cadrul ierarhiilor 
In urma interogârii prin poziționare în cadrul ierarhiilor se poate obține uşor 


raportul dorit (vezi fig. nr. 7). 
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Vânzãri produse 


An Regiune Vânzări 

1999 Moldova 2.000 
Ardeal 2.200 
Banat 1.400 

2000 Moldova 2.580 


Figura nr.7 — Raport obţinut prin poziționarea în cadrul ierarhiilor 


Gradul de detaliere poate fi modificat prin operaţiunile de drill-down (mai 
analitic) sau drill-up (mai sintetic). De exemplu prin drill-down efectuat asupra 


dimensiunii Timp se poate obține un raport mai detaliat, pe trimestre (vezi fig. nr.8). 


Timp Magazin Produs 
An Total magazine Total produse 
catei Regiune Grupă produs 
Lună Judeţ Categorie produs 
Zi Oraş Produs 


Vânzãri produse 


An Trimestru Regiune Vânzãri 

1999 T1 Moldova 400 
T2 Moldova 450 
T3 Moldova 600 
T4 Moldova 550 
T1 Ardeal 700 


Figura nr. 8 — Raport obținut în urma navigãrii în interiorul ierarhiei prin operațiunea 


drill-down 


Un aspect important îl reprezintă gradul de granularitate care indică nivelul de 
detaliere stocat în tabela de fapte. Granularitatea tabelei de fapte depinde direct de gradul 
de detaliere pe care îl au dimensiunile sale. 

De exemplu, dacă fiecare înregistrare Timp reprezintă o zi, fiecare înregistrare 
Produs reprezintă un produs şi fiecare înregistrare Magazin reprezintă un magazin, atunci 
“granula” tabelei de fapte Vânzări care are dimensiunile menţionate este: vânzâri pe 


produs pe zi pe magazin. 
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Faza de analiză a granularitãții unui depozit de date trebuie să fie efectuată foarte 
atent, deoarece o granularitate la un nivel prea sintetic nu permite obținerea de informații 
suplimentare, în timp ce o granularitate accentuată, cu detaliere pronunţată, poate creşte 
exponențial spaţiul ocupat de depozitul de date. 

Din moment ce granularitatea tabelei de fapte determină nivelul de detaliere al 
dimensiunilor din jurul ei, înseamnă că cheia primară a tabelei de fapte este de fapt o 


concatenare a cheilor fiecărei dimensiuni în parte. 


Agregarea este unul dintre cele mai importante concepte din lumea depozitelor 
de date. Utilizarea corectă a agregărilor conduce la o creştere importantă a performanţelor 
depozitului de date în privinţa timpului de răspuns la interogări. O agregare este o valoare 
precalculată stocată în depozitul de date, de obicei într-o schemă separată. Calculul 
valorilor agregate se face pe baza valorilor de la nivelul cel mai analitic (vezi fig. nr.9). 
Avantajul agregârii constă în faptul că utilizatorul, pentru a obţine informaţii cu caracter 
sintetic, poate lansa interogâri asupra valorilor agregate, în loc să solicite sistemul cu 


interogări la nivelul înregistrărilor elementare. 


Timp Magazin Produs 
An Total magazine Total produse 
Trimestru Regiune Grupă produs 
ET cutii arde Citeaza papi 


AS dal AAN II Ia cc e II N ci 


VA EE E PETRU E ERE PRET SOROS Oras matei nt atita aa oleaca Produs 


Figura nr. 9 — Agregarea nivelurilor de bază 
Agregările au mai puține înregistrări decât schemele care conţin nivelurile de 


bază. Să considerăm de exemplu schema din figura nr. 10 cu următoarele caracteristici: 


Figura nr.10 — Exemplu de schemă multidimensională 


VANZĂRI 
Tabela de fapte 


e granula tabelei de fapte este Produs pe Magazin pe Săptămână, 


Tendinţe. De la relațional spre multidimensional 9 


e sunt 10 Magazine, 
e sunt 100 de Produse pentru fiecare Marcă, 
e există cel puțin o Vânzare pe Produs pe Magazin pe Sâptămână. 
Pe baza acestor premise putem calcula numărul de înregistrări de fapte care sunt 


necesare pentru fiecare interogare: 


Dacă o interogare necesită... Atunci trebuie manipulate 


1 Produs, 1 Magazin, 1 Săptămână doar 1 înregistrare din schemă 


1 Produs, Toate magazinele, 1 Săptămână 10 înregistrări din schemă 


1 Marcă, 1 Magazin, 1 Săptămână 100 înregistrări din schemă 


1 Marcă, Toate magazinele, | An 52.000 înregistrări din schemă 


Dacă agregările ar fi calculate şi stocate astfel încât fiecare înregistrare agregată ar 
conține faptele pentru o marcă pe magazin pe săptămână, a treia interogare din cele de 
mai sus ar necesita doar 1 înregistrare în loc de 100. In mod similar, a patra interogare ar 


necesita doar 520 înregistrări în loc de 52.000. Câştigul de timp obţinut este evident. 


Un depozit de date poate conţine simultan mai multe scheme de tip stea, adică 
mai multe tabele de fapte. Fiecare schemă este proiectată pentru a servi un anumit 
necesar informaţional. De asemenea este firesc ca o dimensiune (tabelă de câutare) să fie 


folosită în mai multe scheme de tip stea. 


CONCLUZII: 

Modelarea multidimensională oferă câteva concepte puternice care conferă 
acesteia o serie de calități ce o vor promova în sistemele moderne de sprijinire a 
proceselor decizionale: 

e Modelarea  multidimensională este simplă. Tehnicile de modelare 
multidimensională oferă posibilitatea proiectanților de depozite de date să creeze 
scheme pe care utilizatorii să le poată înţelege şi controla cu uşurinţă. Nu este necesar 
un efort deosebit pentru a învăţa cum se citesc diagramele, deoarece dimensiunile 
imită perfect viziunea multidimensională pe care utilizatorii o au asupra afacerii. 

e Modelarea multidimensională promovează calitatea datelor. Prin modul în care 


au fost gândite, schemele de tip stea păstrează integritatea referențială în interiorul 
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depozitului de date. Cheia tabelei de fapte este concatenarea cheilor dimensiunilor şi 
deci o înregistrare de fapte este încărcată cu succes doar dacă există înregistrările 
corespunzâtoare în tabelele de câutare. 

Optimizarea performanţelor este posibilă prin agregare. Pe măsură ce mărimea 
depozitului creşte, optimizarea performanţei devine o cerință presantă. Utilizatorii 
care trebuie să aştepte ore întregi pentru a obţine răspunsul la o interogare vor fi 
descurajaţi în a folosi depozitul de date; agregârile reprezintă una dintre cele mai la 


îndemână modalități de a creşte performanţa sistemului de interogare. 


